СВОЙСТВА ПОКАЗАТЕЛЕЙ БЕЗОТКАЗНОСТИ ПОСЛЕ КОРРЕКТИРОВКИ

Для описания свойств оценок достаточно выяснить, насколько они состоятельны, эффективны и несмещенны [31]. В общем случае такая проверка может быть выполнена как аналитически, так и статистически. Аналитический анализ свойств оценок переходных ве­роятностей, полученных при использовании алгоритмов математи­ческого программирования особенно с ограничениями, затрудните­лен [40]. Более целесообразным путем является статистическое м»

шлпрование, хотя и в этом случае достаточно полная и подробная прпнсрка требует весьма обширных вычислений. Поэтому ограни­чимся изложением качественных свойств оценок и приведем неко — |1>рыс результаты моделирования, которые будут иллюстрировать характер таких оценок.

Остановимся прежде всего на состоятельности получающихся опенок. При использовании метода максимума правдоподобия (ЛМП) оценки вероятностей переходов являются состоятельными, і с мри увеличении объема выборки они сходятся по вероятности к пішім истинным значениям [53]. В [40] указывается, что в случае вычисления оценок по методу наименьших квадратов также обеспе­чивается их состоятельность.

Оценки, получаемые с помощью алгоритма квадратичного про­граммирования (АКП), занимают с точки зрения вида используе — мnii информации промежуточное положение. На основе этого мож — ІІП предполагать, что они также обладают свойством состоятельно- » пі В самом деле, пусть, для момента t методом максимума прав­ді июдобия определена матрица оценок стационарных вероятностей перехода (рц’)- Если увеличивать объем реализаций т для полу­чения таких оценок, то при т—> oolim (р’и)=(рц) [90]. Однако при

т-*~°о

ним векторы Яi(t) И Яз(£-г1) также сходятся к одному и тому же с і лцпонарному распределению и (6.16) строго выполняется. Это

0 111. іч ает, что все невязки равны нулю, и, следовательно, решением шц.’ічн квадратичного программирования являются истинные значе­ния вероятностей переходов. Тем самым доказывается состоятель — 1вїсть оценок, получаемых на основе алгоритма (6.19) —(6.20).

Рассматривая эффективность и смещенность оценок {pij), сле — /1 с і отметить, что для их формирования используется менее пол­или информация, чем при методе максимума правдоподобия. По­мом у, если возможно применение алгоритма квадратичного про-

1 рлммпрования и метода максимума правдоподобия, то последний оосснечит более эффективные оценки. Это вытекает из неравенства

11. і о Крамера для границы дисперсии, в соответствии с которым ив версия обратно пропорциональна количеству информации, со — и-рълщейся в выборке. Поэтому эффективность метода (и получа­ющихся оценок) целесообразно оценивать вообще и особенно в си — ivлини, когда при воздействии внешних факторов техническое сос — і’іяпне АС изменяется, а метод максимума правдоподобия непри — МПІНМ. В этом случае задача сводится к получению ответа на воп­рос, какие оценки в моменты 6hs s> 1 лучше — полученные в мо — м< їм //( (т. е. {pij)) или их скорректированные значения (рц)?

И H1CCTHO [31], что при оценивании любого параметра 6, 0^6^

I, никакая статистика, распределение которой сосредоточено на пнн рнале (0, 1), не будет несмещенной, так как для 6 = 0 ее мате — маміческое ожидание превосходит 0 (за исключением тривиальных с лучаен вырождения). С помощью алгоритма квадратичного про­граммирования оцениваются параметры, удовлетворяющие именно пому случаю. Поэтому следует ожидать смещения оценок вероят­ностей переходов, особенно при рц=0. Отмеченное обстоятельство подтверждается результатами оценивания по методу наименьших квадратов с ограничениями і[40]. В этом случае все средние значе­ния оценок рц, соответствующие нулевым элементам Ра, больше нуля. При моделировании около 60% всех полученных для таких Ра оценок точно совпадали с истинными (т. е. нулевыми) значени­ями, а модули остальных оценок были невелики. Эти данные слу­жат косвенным доказательством того, что в среднем возникающее смещение будет не очень большим.

Несмещенность и эффективность не обязательно анализировать раздельно, так как обе характеристики описывают отклонение оце­нок от истинных значений, а основная задача алгоритма квадратич­ного программирования как раз и состоит в том, чтобы такое откло­нение минимизировать. Один из удобных критериев в этом слу­чае — минимум среднего квадрата ошибки. В геометрическом смыс­ле этот подход связан с построением и оценкой «расстояния», отде­ляющего получающуюся оценку от истинного значения. Чем мень­ше такое «расстояние», тем качественнее оценка. В общем случае минимизация среднего квадрата ошибки дает результаты, отличаю­щиеся от тех, которые получаются при минимизации дисперсии.

Вследствие того, что в рассматриваемом случае необходимо оце­нить расстояние не между отдельными оценками, а между совокуп­ностью оценок (матрицей вероятностей переходов), определим это «расстояние» следующим образом:

і-І7-1 _

где рц — оценка, получаемая по алгоритму (6.19)—(6.20); pij — истинное зна­чение элемента МБП.

Очевидно, в силу случайности оценок (рц) величина R2 также будет случайной. Для получения более устойчивого значения целе­сообразно усреднить ее по множеству реализаций:

2 І 2да-Л/)а. (6.25)

* 5=1 1 = 1 7=1

где S — ЧИСЛО повторных вычислений оценок Pi).

Будем использовать эту величину в качестве меры эффективно­сти получающихся оценок. Следует подчеркнуть, что хотя по внеш­нему виду Л2 напоминает выражение для дисперсии в многомерном случае, таковым оно не является вследствие смещения в оценках

Pij относительно pij.

При статистическом моделировании меру (6.25) можно получить следующим образом.

Зададим некоторую матрицу вероятностей переходов Qi = ||<7гД|, значения элементов которой точно известны. Будем считать ее истинной и искать отклонения именно относительно матрицы ||<7ІЗ-1|. Сформируем на основе матрицы Qi множество реализаций,.

описывающих поведение процесса во времени. По этим реализаци­ям, используя методы максимума правдоподобия и квадратичного программирования, получим оценки, которые обозначим соответ­ственно (qf{tk)) и (?/f(4))> k=,…,k, s=l, Подставляя

найденные значения в (6.25), получим Л2 (4) и Л2 (4), сопоставле­ние которых позволит сравнить эффективность этих методов и выя­вить характер зависимости получаемых оценок от объема инфор­мации (например, по мере увеличения номера k).

Сравнение проведем для следующих случаев.

I. Для всех моментов времени 4, k=l, К накапливается ин­формация, достаточная для применения методов максимума прав­доподобия и квадратичного программирования. При этом количест­во реализаций т для всех моментов одинаково.

II. Для моментов времени 4, k=2,…, К информация накаплива­ется только в виде безусловного распределения значений парамет­ров по состояниям цепи Маркова, причем общее количество реали­заций для любого 4 меньше, чем в момент k(m2(th)<Zmi(ti)).

Для обоих случаев предполагается, что техническое состояние но времени описывается одной и той же матрицей вероятностей пе­реходов.

III. В некоторый момент th(k>l) произошло существенное из­менение технического состояния АС, что привело к изменению зна­чений элементов истинной матрицы вероятностей переходов. Для всех 4, k~>2 информация накапливается только в виде безуслов­ных распределений по состояниям цепи Маркова.

Случай I введен для того, чтобы сравнить качество оценок, по­лучаемых по методу максимума правдоподобия и методу квадра­тичного программирования. Случай II позволяет ответить на сле­дующие вопросы: какая оценка (6.25) лучше в моменты tKV k — 2,…, К — получаемая в момент 4 и используемая далее без коррек­тировки или получаемая с учетом коррекции по алгоритму § 6.3; как изменяется величина (6.25) по мере проведения последующих корректировок?

Для описания реальных ситуаций второй случай более приго­ден, чем первый (например, если система диагностирования АС определяет принадлежность значения обобщенного параметра к ча­сти поля допуска). Кроме того, на местах эксплуатации объем ин­формации может быть меньше, так как диагностируется только часть АС, а не вся партия, выпущенная заводом-изготовителем. Наиболее близок к реальной ситуации III случай, так как он поз­воляет учесть условия эксплуатации на местах, возможные дора­ботки, при которых исходной информации о техническом состоянии в виде реализаций ОП нет и т. п. Поэтому при анализе этого слу­чая можно ответить на вопросы—насколько существенна первая коррекция и как в результате последующих коррекций изменяется величина (6.25). Иными словами, возможно оценить, как отслежи­вает алгоритм квадратичного программирования изменение техни­ческого состояния АС.

Моделирование производится по следующей методике.

Для всех случаев при заданной матрице вероятностей перехо­дов реализации моделируются по стандартной методике [29], при этом начальное состояние для случая I определяется на основе фи­нального вектора, представляющего собой строку матрицы фи­нальных вероятностей Qj^limQ4, а число реализаций равно т.

Для случая II до момента k—1 используется число реализаций Ш, а начиная с некоторого k количество реализации т2, по кото­рым строятся оценки безусловного распределения, сокращается (m2<mi).

В случае III до момента k—1 элементы матрицы оцениваются по методу максимального правдоподобия, причем реализации стро­ятся на основе опорной матрицы Q. Затем опорная матрица изме­няется, и в моменты k,…, К безусловные распределения строятся по значениям, полученным при моделировании матрицы Qz¥=Qi — Эти безусловные распределения используются в алгоритме квадра­тичного программирования для корректировки значений переход­ных вероятностей. МатрицыСД и Q2 имеют вид:

СВОЙСТВА ПОКАЗАТЕЛЕЙ БЕЗОТКАЗНОСТИ ПОСЛЕ КОРРЕКТИРОВКИ

Исходные данные следующие: для варианта I т=200; для ва­рианта II mi = 100, m2=60, £ц = 3; для варианта III mi = 200; m2 = =200, ki = 3. Во всех вариантах К=7, а число повторных циклов моделирования — 14.

Обобщенные результаты расчетов величины R2 приводятся в табл. 6.1, где прочерки означают, что алгоритм нс использовался, а знак X — использовать было невозможно.

Из табл. 6.1 видно, что оценки элементов матрицы переходных вероятностей, полученные методом максимума правдоподобия при всех tk эффективнее оценок, найденных на основе АКП (вариант I). Это подтверждает сделанное ранее замечание о том, что всегда, когда возможно, для получения оценок должен использо­ваться ММП. Из анализа данных варианта II следует, что исполь­зование АКП позволяет повысить эффективность (в смысле R2) оценок по сравнению с оценками, полученными ММП, но на более ранних стадиях. Наконец, данные варианта III позволяют сделать вывод, что АКП достаточно эффективно отслеживает изменение технического состояния АС. Так, после первой же корректировки величина R2 уменьшилась более чем в 3 раза.

Таким образом, по мере появления дополнительной информации и ее учета с помощью АКП качество оценок вероятностей перехо­дов улучшается, что подтверждает их состоятельность. Однако следует отметить, что скорость. уменьшения R2 после второй и пос­ледующих корректировок не очень велика.

П. фиант

Алгоритм

k

1

2

3

4

5

6

7

і

ММП

0,0622

0,0288

0,0158

0,0139

0,0112

0,0102

0,0093

АКП

0,0492

0,0464

0,0446

0,0436

0,0427

0,0417

к

ММП

0,1390

0,0631

X

X

X

X

X

АКП

0,0538

0,0529

0,0520

0,0511

0,0502

in

ММП

0,0622

0,0288

0,4650

X

X

X

X

АКП

0,1485

0,1392

0,1300

0,1208

0,1115

Из сравнения величин Л2 при К=7 для вариантов I и III следу — ■ і, что значения вероятностей переходов, относительно которых производится корректировка, существенно влияют на конечный ре — іулмат. Так, при матрице, более близкой к истинному значению, величина Д2 после ряда корректировок оказывается меньше (ва­риант I).

15 целом алгоритм квадратичного программирования эффектив­ен корректирует значение МВП, особенно при существенном изме­нении технического состояния.